Model Selection

Spatiotemporal Feature Extraction

# Spatiotemporal Feature Extraction

Videomae Base Finetuned Ucf101 Subset

A video understanding model fine-tuned on a subset of UCF101 based on the VideoMAE base model, achieving 95.71% accuracy

Video Processing

Videomae Base Ssv2 Finetuned Rwf2000

A video understanding model based on the VideoMAE architecture, fine-tuned on the RWF-2000 dataset for violence detection tasks

Video Processing

Videomae Base Ssv2

VideoMAE is a self-supervised video pre-training model based on masked autoencoder, pre-trained for 2400 epochs on the Something-Something-v2 dataset.

Video Processing

Videomae Large Finetuned Kinetics

VideoMAE is a self-supervised video pre-training model based on masked autoencoder, fine-tuned on the Kinetics-400 dataset for video classification tasks.

Video Processing

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase